【274期】面试官：怎么保证缓存和数据库一致性

Java面试题精选 2022-03-20

背景

缓存是软件开发中一个非常有用的概念，数据库缓存更是在项目中必然会遇到的场景。而缓存一致性的保证，更是在面试中被反复问到，这里进行一下总结，针对不同的要求，选择恰到好处的一致性方案。

缓存是什么

存储的速度是有区别的。缓存就是把低速存储的结果，临时保存在高速存储的技术。

图片

如图所示，金字塔更上面的存储，可以作为下面存储的缓存。

我们本次的讨论，主要针对数据库缓存场景，将以redis作为mysql的缓存为案例来进行。

为什么需要缓存

存储如mysql通常支持完整的ACID特性，因为可靠性，持久性等因素，性能普遍不高，高并发的查询会给mysql带来压力，造成数据库系统的不稳定。同时也容易产生延迟。

根据局部性原理，80%请求会落到20%的热点数据上，在读多写少场景，增加一层缓存非常有助提升系统吞吐量和健壮性。

存在问题

存储的数据随着时间可能会发生变化，而缓存中的数据就会不一致。具体能容忍的不一致时间，需要具体业务具体分析，但是通常的业务，都需要做到最终一致。

redis作为mysql缓存

通常的开发模式中，都会使用mysql作为存储，而redis作为缓存，加速和保护mysql。但是，当mysql数据更新之后，redis怎么保持同步呢。

强一致性同步成本太高，如果追求强一致，那么没必要用缓存了，直接用mysql即可。通常考虑的，都是最终一致性。

解决方案

方案一

通过key的过期时间，mysql更新时，redis不更新。

这种方式实现简单，但不一致的时间会很长。如果读请求非常频繁，且过期时间比较长，则会产生很多长期的脏数据。

优点：

开发成本低，易于实现；
管理成本低，出问题的概率会比较小。

不足：

完全依赖过期时间，时间太短容易缓存频繁失效，太长容易有长时间更新延迟（不一致）

方案二

在方案一的基础上扩展，通过key的过期时间兜底，并且，在更新mysql时，同时更新redis。

图片

优点：

相对方案一，更新延迟更小。

不足：

如果更新mysql成功，更新redis却失败，就退化到了方案一；
在高并发场景，业务server需要和mysql,redis同时进行连接。这样是损耗双倍的连接资源，容易造成连接数过多的问题。

方案三

针对方案二的同步写redis进行优化，增加消息队列，将redis更新操作交给kafka，由消息队列保证可靠性，再搭建一个消费服务，来异步更新redis。

图片

优点：

消息队列可以用一个句柄，很多消息队列客户端还支持本地缓存发送，有效解决了方案二连接数过多的问题；
使用消息队列，实现了逻辑上的解耦；
消息队列本身具有可靠性，通过手动提交等手段，可以至少一次消费到redis。

不足：

依旧解决不了时序性问题，如果多台业务服务器分别处理针对同一行数据的两条请求，举个栗子，a = 1；a = 5; 如果mysql中是第一条先执行，而进入kafka的顺序是第二条先执行，那么数据就会产生不一致。
引入了消息队列，同时要增加服务消费消息，成本较高，还有重复消费的风险。

方案四

通过订阅binlog来更新redis，把我们搭建的消费服务，作为mysql的一个slave，订阅binlog，解析出更新内容，再更新到redis。

图片

优点：

在mysql压力不大情况下，延迟较低；
和业务完全解耦；
解决了时序性问题。

缺点：

要单独搭建一个同步服务，并且引入binlog同步机制，成本较大。

总结

方案选型

首先确认产品上对延迟性的要求，如果要求极高，且数据有可能变化，别用缓存。

通常来说，方案1就够了，笔者咨询过4，5个团队，基本都是用方案1，因为能用缓存方案，通常是读多写少场景，同时业务上对延迟具有一定的包容性。方案1没有开发成本，其实比较实用。

如果想增加更新时的即时性，就选择方案2，不过没必要做重试保证之类的。

方案3，方案4针对于对延时要求比较高业务，一个是推模式，一个是拉模式，而方案4具备更强的可靠性，既然都愿意花功夫做处理消息的逻辑，不如一步到位，用方案4。

结论

一般情况，方案1够用。若延时要求高，直接选择方案4。如果是面试场景，从简单讲到复杂，面试官会一步一步追问，咱们就一点点推导，宾主尽欢。

来源：juejin.im/post/5d5c99b66fb9a06ae072060d

END

十期推荐

【261期】面试官：说出几个你熟悉的 Zookeeper 命令

【262期】面试官：谈谈MySQL主从复制的原理

【263期】面试最后一问：你有什么要问我的吗？

【264期】盘点MySQL主从复制，在面试中能被问什么？

【265期】面试官：为什么Integer用==比较时127相等而128不相等？

【266期】面试官：Redis主从集群切换数据丢失问题如何应对？

【267期】10道经典MySQL面试题

【268期】美团面试题：当你的JVM 堆内存溢出后，其他线程是否可继续工作？

【269期】链表高频面试题（包括反转、合并、相交、分割、环长等）

【270期】面试官：Spring的Bean实例化过程应该是怎样的？

与其在网上拼命找题？ 不如马上关注我们~

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

毕业论文辅导| 你又不是伞，硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞！

缺人：60r/次，立结~

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

【274期】面试官：怎么保证缓存和数据库一致性

背景

缓存是什么

为什么需要缓存

存在问题

redis作为mysql缓存

解决方案

方案一

方案二

方案三

方案四

总结

方案选型

结论

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

毕业论文辅导| 你又不是伞，硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞！

缺人：60r/次，立结~

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

生成图片，分享到微信朋友圈

【274期】面试官：怎么保证缓存和数据库一致性

背景

缓存是什么

为什么需要缓存

存在问题

redis作为mysql缓存

解决方案

方案一

方案二

方案三

方案四

总结

方案选型

结论

您可能也对以下帖子感兴趣